查看原文
其他

MariaDB新版本实力逆袭,不仅仅是MySQL的替代品

2016-12-16 贺春旸 DBAplus社群



作者介绍

贺春旸惠普金融MySQL专家,《MySQL管理之道》第一版、第二版作者。曾任职于中国移动飞信、机锋安卓市场,拥有丰富的数据库管理经验。目前致力于MySQL、Linux等开源技术的研究。


MySQL分支——MariaDB


MariaDB是MySQL源代码的一个分支,主要由开源社区在维护,采用GPL授权许可。开发这个分支的原因之一是:甲骨文公司收购了MySQL后,有将MySQL闭源的潜在风险,因此社区采用分支的方式来避开这个风险。MariaDB是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。在存储引擎方面,使用XtraDB来代替MySQL的InnoDB,XtraDB完全兼容InnoDB,创建一个InnoDB表内部默认会转换成XtraDB。


Percona XtraDB 是 InnoDB 存储引擎的增强版,用来更好地发挥最新的计算机硬件系统性能,同时还包含一些在高性能环境下的新特性。XtraDB 存储引擎是完全的向下兼容,在 MariaDB 中,XtraDB 存储引擎被标识为"ENGINE=InnoDB",这与 InnoDB 是一样的,所以可以直接用XtraDB 替换掉 InnoDB,而不会产生任何问题。XtraDB 在 InnoDB 的基础上构建,使 XtraDB 具有更多的特性,更多的参数指标和更多的扩展。从实践的角度来看,XtraDB 在CPU多核的条件下更有效的使用内存,并且性能更高。从 MariaDB 5.1 开始就默认使用 XtraDB 存储引擎。


MariaDB由MySQL的创始人Michael (Monty) Widenius主导开发,他早前曾以10亿美元的价格,将自己创建的公司MySQL AB卖给了SUN,此后,随着SUN被甲骨文收购,MySQL的所有权也落入Oracle的手中。MariaDB名称来自Michael (Monty) Widenius的女儿Maria的名字。


一、MariaDB 10.0和MySQL 5.6的不同之处


MySQL 5.6 的代码库的文件结构已经被改动了。比如单个代码文件已经被分成多个,又或者是某些代码已经被重新归类到了不同的文件内。所以要把MariaDB 去配合现在这个文件结构一定是一个非常消耗时间的过程。


MairaDB 5.5 已经有大量的代码不同于MySQL 5.5 的版本,而且也有很多的新的特征被整合到MariaDB 5.5 中,而这些特征直到 5.6 版本才出现在MySQL中。所以在比较同样功能的MySQL和MariaDB的版本,同时在完成设计和QA方面的审核后,一个很明显的结论是MariaDB会是一个更好的产品。在大多数情况下,在选择 MariaDB的时候,人们会更多地考虑到功能方面的偏好。


MariaDB不仅仅是MySQL的一个替代品。它的主要目的是创新和提高MySQL的技术,MySQL5.6不是一个合适的创新基础平台,所以MariaDB团队就做了下面的事情:

  • 引入了一些新功能(像Multi-source Replication多源复制,基于表的并行复制,Galera Cluster集群,Spider水平分片存储引擎,TokuDB存储引擎等),所以需要搞个新版本。

  • 下个版本称作“MariaDB5.6”是不准确的,因为它不是基于MySQL5.6的,取而代之,MariaDB团队决定版本号调为10.0。


MariaDB和Percona有什么不同呢?


Percona是仅仅针对InnoDB引擎上做了性能上的改善(称为XtraDB),而MariaDB在集成了XtraDB存储引擎之外,还集成了更多的存储引擎,包括Aria、SphinxSE、TokuDB、Cassandra、CONNECT、SEQUENCE及Spider存储引擎等,并且在服务器层上做了大量改进,增加了多源复制和基于表的并行复制等。


二、MariaDB和MySQL的兼容性


MariaDB跟MySQL在绝大多数方面是兼容的,对于前端应用(比如PHP、Perl、Python、Java、.NET、MyODBC、Ruby、MySQL C connector)来说,几乎感觉不到任何不同。目前MariaDB是发展最快的MySQL分支版本,新版本的发布速度已经超过了Oracle官方的MySQL版本。


注:MariaDB10.0/10.1的GTID复制跟MySQL5.6不兼容。


在Oracle控制下的MySQL开发,有两个主要问题:

  • MySQL核心开发团队是封闭的,完全没有Oracle之外的成员参加。很多高手即使有心做贡献,也没办法做到。

  • MySQL新版本的发布速度,在Oracle收购Sun之后大为减缓。


Michael (Monty) Widenius有一个PPT,用数据比较了收购之前和之后新版本的发布速度,并表示有很多bugfix和新的feature,都没有及时加入到发布版本之中。


以上这两个问题,导致了各个大公司,都开发了自己定制的MySQL版本,包括Yahoo!、Facebook、Google、阿里巴巴和淘宝网等。MySQL是开源社区的资产,任何个人/组织都无权据为己有。为了更快速地发展MySQL,另外开分支是必须的。


、MariaDB 10.0新增的功能


更多的存储引擎


除了包含标准的MyISAM、BLACKHOLE、CSV、MEMORY、ARCHIVE和MERGE等存储引擎外,MariaDB的源代码包和二进制包还包含以下额外的存储引擎:

  • Aria(增强版的MyISAM)

  • XtraDB(增强版的InnoDB)

  • FederatedX

  • OQGRAPH

  • SphinxSE[1]

  • IBMDB2I

  • TokuDB[2]

  • Cassandra

  • CONNECT

  • SEQUENCE

  • Spider[3]

  • PBXT


速度提升


在MariaDB5.3版本里,就已经对子查询进行了优化,并采用semi join半连接方式将SQL改写为了表关联join,从而提高了查询速度。


在MariaDB5.3版本里,引入了Group commit for the binary log组提交技术,简单的说,多个并发提交的事务加入一个队列里,对这个队列里的事务,利用一次I/O合并提交,从而解决了写日志频繁刷磁盘的问题。


在MariaDB10.0版本里,引入了基于表的多线程并行复制技术,如果主库上1秒内有10个事务,那么合并一个I/O提交一次,并在binlog里增加一个cid = XX 标记,当cid的值是一样时,Slave就可以进行并行复制,通过设置多个sql_thread线程实现。在MySQL5.5版本里是单进程串行复制,通过sql_thread线程来恢复主库推送过来的binlog,这样会产生一个问题,主库上大量的写操作,从库就有可能会出现延迟。在MySQL5.6是基于库级别的并行复制,MySQL5.7是基于表级别的并行复制。


在MariaDB5.5版本里,引入了线程池thread pool技术,线程池的连接复用,减少了建立连接的开销,减少了CPU上下文切换,非常适合高并发php短连接应用场景(例如使用开源电商平台ECSHOP秒杀业务场景)。


在处理内部的临时表,MariaDB用Aria引擎代替了MyISAM引擎,这将使某些GROUP BY和DISTINCT请求速度更快,因为Aria有比MyISAM更好的缓存机制。


扩展和新功能


  1. 时间精确到微秒级别

  2. 提供了虚拟列(函数索引)

    在MariaDB5.2版本里,就已经提供了虚拟列(函数索引),但直到MySQL5.7版本才支持。

  3. kill命令扩展

    在MariaDB5.3版本里,又对kill命令进行了扩展,可以指定某个user用户,杀死所有查询

  4. 修改表结构可显示执行进度

  5. 提供了动态列(可以存储JSON格式)

    在MariaDB5.3版本里,就已经提供了动态列(可以存储JSON格式),但直到MySQL5.7版本才支持。

  6. 提供了多源复制,但直到MySQL5.7版本才支持。

  7. 支持GTID同步复制。

  8. 创建了用户支持创建角色role权限。

  9. 通过show processlist可以查看内存占用。

  10. 执行create or replace table 等于先执行drop操作,再执行create操作。

  11. 执行delete from table returning命令可删除前返回删除的记录。

  12. 慢查询日志slow log里增加了explain执行计划。


四、总结


MariaDB是甲骨文MySQL的加强版本,因此已有的系统不需要任何修改就可以运行,就像使用Percona Server一样。


MariaDB社区版和企业版的源代码都是开源的,并且所有功能都是免费开放,不用担心功能上有阉割,但甲骨文MySQL企业版延伸套件采取封闭源代码且需要付费。此外,MariaDB相比MySQL拥有更多的功能、更快、更稳定、BUG修复更快。


想了解更多详情可参考:

https://cread.e.jd.com/read/startRead.action?bookId=30300000&readType=1 


相关专题:


精选专题(官网:dbaplus.cn)

◆  近期热文  ◆  

一篇文全面读懂缓存与队列(附源码)

从SQL改写到SQL重写,什么样的SQL才是好SQL?

与MySQL传统复制相比,GTID有哪些独特的复制姿势?

当当网资深DBA:DB运维四大现代化的实现

写给DBA,也写给想从事数据库工作的你


◆  MVP专栏  ◆  

杨志洪杨建荣邹德裕韩锋欧阳辰

网易腾讯云百度朱祥磊卢钧轶

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存